1
CUDAの実行モデル:ホストとデバイスの比較
AI032Lesson 3
00:00

CUDAの実行モデルは、あなたのコンピュータを高性能な異種システムに変換します。次のように想像してください: 大指揮者(ホスト/CPU) そして 数千人の軍隊(デバイス/GPU)大指揮者は複雑な論理や意思決定を担当し、軍隊は膨大で繰り返し行われるタスクを同時に実行します。

1. 構造上の違い

ホスト ホスト はレイテンシ最適化されたCPUであり、複雑な制御フローと逐次的タスクに適しています。逆に、 デバイス デバイスはスループット最適化されたGPUで、数多くの単純なコアを内蔵しており、巨大なデータセットに対して同じ命令を同時に実行するように設計されています。

2. 実行のリズム

CUDAプログラムは一連のフェーズとして機能します。実行は"逐次コード"のためにホスト上で開始されます。プログラムが"並列カーネル"に到達すると、 グリッド スレッドのグリッドをデバイスに起動します。デバイスが膨大なワークロードを終了すると、制御はホストに戻ります。

ホスト(CPU)デバイス(GPU)逐次コード並列カーネル(スレッドのグリッド)逐次コード

3. パフォーマンスの特化

このモデルは両方の長所を活用します:CPUはシステムリソースや複雑な分岐を管理し、一方でGPUは SPMD(単一プログラム、多数データ) ロジックによってデータ要素を並列処理します。

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>